ПОСТАНОВКА ЗАДАЧИ ОПТИМИЗАЦИИ ПАРАМЕТРОВ СИСТЕМЫ ПОДДЕРЖАНИЯ ЛЕТАТЕЛЬНЫХ КОМПЛЕКСОВ В ГОТОВНОСТИ К ПРИМЕНЕНИЮ НА ОСНОВЕ ПОЛУМАРКОВСКИХ МОДЕЛЕЙ
Рассмотрим возможности постановки и решения задачи оптимизации вектора Х(^) параметров системы эксплуатации ЛК при найденных требуемых (оптимальных) выходных показателях (t) системы. Эта, вторая по иерархическому уровню, задача оптимизации программы эксплуатации системы ЛК в общем виде была сформулирована в § 7.1 [см. (7.14) и (7.15)1.
Для решения подобных задач в соответствии с последовательностью, установленной в §7.1, дадим описание системы эксплуатации ЛК, которое позволит выделить вектор Х(/) оптимизируемых параметров.
Полагаем, что оптимизируемые параметры Х(/) = (xv (0} мало і. тшісят от времени эксплуатации, например определяют систему жсплуатации ЛК после проведения основных доработок или на каком — либо интервале (не обязательно малом), в течение которого можно пренебречь их изменением. На рис. 7.5 показано характерное изменение параметра xv (t) системы эксплуатации и возможное представление сто в виде постоянных величин.
Один из вариантов описания части системы эксплуатации — подсистемы или системы поддержания ЛК в готовности к применению но назначению — был приведен в § 3.2. Система поддержания ЛК в готовности (СПГ ЛК) определяется структурой контроля технического состояния комплекса, его ТО и устранения неисправностей (восстановления готовности), а также совокупностью соответствующих па — р. зметров (периодичностью и продолжительностью различных видов ТО, ошибками первого и второго рода при контроле, продолжительностью восстановления готовности и т. п.). Совокупность оптимальных по некоторому критерию значений этих параметров определяет основную часть программы эксплуатации комплекса и системы ЛК.
Остальные характеристики программы эксплуатации ЛК могут ^ быть установлены при анализе и синтезе подсистем: ввода комплекса і в эксплуатацию, приведения в готовность к применению, ремонтов основных элементов ЛК, хранения, сбережения и снабжения комплексов ЗИПом и др. Однако система поддержания ЛК в готовности определяет структуру всех других подсистем, так как именно она обеспечивает высокое значение основных выходных показателей системы эксплуатации в целом.
В связи с этим рассмотрим далее задачу оптимизации параметров СПГ ЛК — В соответствии с общей постановкой задачи (7.15) необходимо на основе описания и построения модели СПГ найти вектор оптимизируемых параметров X = {xv }, целевую функцию и функцию ограничений. Важно заметить, что целевая функция должна включать только часть Сэ функции стоимости эксплуатации системы ЛК (6.24), {6.25), а функции ограничений — часть R обобщенного показателя надежности (3.15), (3.16), чтобы обеспечить их критичность к оптимизируемым параметрам СПГ как части общей системы эксплуатации.
Наиболее удобной моделью СПГ является структура, представляемая состояниями, в которых пребывает элемент, включающий одну ПУ ‘ (с ЛА), аппаратуру для контроля их технического состояния, персонал и оборудование для проведения ТО и восстановления готовности. Такой элемент часто называют одноканальным летательным комплексом. В соответствии со структурой системы ЛК, показанной на рис. 6.1, его можно представить пусковой установкой с ЛА, 1/п-ной частью элементов единичного ЛК, обеспечивающих контроль технического состояния, 1/(шп)-ной частью элементов ЛК, предназначенных для проведения ТО и восстановления готовности ПУ.
В § 3.2 (см. рис. 3.2) в качестве примера был приведен граф состояний СПГ одноканального ЛК и показаны различные направления переходов СПГ из одного состояния в другое. Математическое описание такой СПГ как некоторого обобщенного элемента удобнее всего вести на основе теории тлумарковских процессов, которая позволяет при относительно небольшом числе состояний получить конечные аналитические выражения для искомых целевой функции и функции ограничений через параметры СПГ. В общем случае (см. § 3.2) на основе этой же модели можно найти конкретные характеристики СПГ, используя метод статистического моделирования, однако решение задачи оптимизации в этом случае затруднительно или невозможно.
Рассмотрим коротко сущность марковских (МП) и полумарковских (ПМП) процессов и приведем без подробных доказательств некоторые формулы, необходимые для их описания, чтобы на этой основе дать математическую постановку задачи оптимизации параметров СПГ. При рассмотрении положений теории МП и ПМП используем труды [6, 8, 9, 20, 29, 30, 34, 36, 37, 39, 41, 62, 66, 73], однако за основу примем разработки В. В. Блаженкова, отличающиеся ясностью изложения и глубоким раскрытием физической сущности математических моделей. *
Полумарковские процессы введены независимо и почти одновременно в 1954—1955 гг. П. Леви, В. Смитом и Л. Такачем. Полумарковские
процессы представляют собой непосредственное обобщение хорошо и ivioinibix в теории вероятностей цепей Маркова.
Марковский процесс с непрерывным временем опишем следующим пиратом. Рассматриваемый элемент одновременно может находиться п одном н только одном состоянии і = 1,2, …, п из множества Е ВОЗМОЖНЫХ (і 6 Е). В фиксированный момент t = 0 элемент находится и одном из состояний і 6 Е и проводит в нем случайное время ть распределенное по экспоненциальному закону с параметром сщ> 0; II момент t = Ті элемент мгновенно переходит в новое состояние j 6 Е С вероятностью Pij >0, Причем У p. j 1 для любого і 6 Е. В со
стоянии j элемент пребывает случайное время т2, распределенное по іксмопенциальному закону с параметром ы}> 0, и т. д.
Вели время пребывания элемента в любом t-м состоянии до перехода и /-е состояние есть случайная величина с произвольной функцией распределения, то процесс называют полу марковским.
Существует несколько способов задания ПМП. Рассмотрим тот, который удобнее использовать при решении практических задач. 11ол у марковский процесс определен, если заданы: 1) граф состояний, т. е. состояния і = 1, 2, .., п (і 6 Е) и возможные переходы {г/};
2) матрица Q = Qu(l) независимых функций распределения времени пребывания элемента в /-м состоянии перед переходом в /-е состояние, если бы данный выход из состояния і был единственным; .'() начальное состояние в момент t = 0.
На основе этих исходных данных могут быть найдены различные характеристики ПМП, среди которых всегда определяются вероятности /і, і перехода из состояния і в состояние / в момент скачка, а также безусловные математические ожидания /г- времени пребывания элемен — ІЛ В 1-м состоянии.
Для расчета рц и tt далее используем вероятности и математические ожидания, определения которых весьма похожи, поэтому читатель должен быть особенно внимателен при введении новых характеристик. І Іачпем с определения величины ptj. В соответствии с функциями распределения Qij(t) существуют случайные моменты ti} переходов из состояния і во все смежные с ним /, но реализуется одно из них, имеющее меньшее значение:
h = min tu.
ieE
Следовательно, вероятность перехода из состояния і в состояние / за время не более t есть вероятность сложного события, заключающегося в том, что элемент будет пребывать В 1-м состоянии в течение времени t и что в момент t он перейдет именно в /-е состояние.
Сведем условную функцию распределения т. е. вероятность
I Ml II, что время пребывания в состоянии і не превосходит t, при условии, что из состояния і процесс переходит в состояние у. Тогда за время не более t вероятность перехода из состояния і в состояние у
Рц (0 = Fu (0 Pij ■
Вероятность Pij(t) зависит от наличия других направлений перехода k ф /, характеризуемых функциями Qik(t). Вычислим вероятность невыхода из состояния і за время г по направлениямk ф /. Вейлу независимости Qikix) получим
П [1 — QlfcM]. (7.76)
кф
Вероятность перехода по направлению j в окрестности момента т равна dQij(т). Тогда искомая вероятность перехода из состояния і в состояние / за время не более t
t
Pu(0 = f П (1 — Qik(т)] dQu (т), (7.77)
•а для неограниченного времени (Fu(t) = 1) в силу (7.75)
оо
Ри(<*>) = Pif n[l_QJk(t)]dQ„(T). (7.78)
о k*>
Безусловная функция распределения Ft(t) времени пребывания в состоянии і
Pi (0 = 2 PijPii (0 = 2 Рц it). (7.79)
ІЄЕ /Є£
Получим более удобную для вычислений зависимость. По аналогии с (7.76) вероятность невыхода из состояния і по всем направлениям / за время не более t
п [l-Q«(0b
тогда вероятность пребывания в состоянии і в течение времени, меньшего /, т. е. безусловная функция распределения
Pi(t)= 1- П [1-<Ы0Ь (7.80)
ієВ
Если известна функция распределения случайной величины t да интервале (0, оо), то ее математическое ожидание
т. е. переходы из состояния і в состояние / происходят через единицу времени, то ПМП вырождается в цепь Маркова с дискретным временем.
Полумарковский процесс, рассматриваемый только в моменты переходов, определяется матрицей Р = [рц], и, следовательно, сводится к марковской цепи, в которой предыстория процесса до попадания в состояние і не влияет на его дальнейшее поведение.
Такой марковский процесс, содержащийся в полумарковском, называют вложенной марковской цепью (ВМЦ).
Характерный вид реализации ВМЦ показан на рис. 7.6, где по оси ординат отложены возможные состояния (і = 1,
2, …, п) процесса, а по оси абсцисс — неслучайное, равное единице, время пребывания в данном состоянии [см.
(7.83)]. Если длина каждой ступеньки на рисунке станет случайной с произвольной функцией распределения, то получим реализацию ПМП, а при экспоненциальном распределении времени пребывания в каждом состоянии — марковский процесс с непрерывным временем.
Для рассматриваемого класса инженерных задач полной характеристикой являются стационарные вероятности Рг £-го состояния ПМП, которые можно найти как отношение среднего времени tt пребывания в г’-м состоянии к среднему интервалу времени ти между последовательными попаданиями в это состояние:
Pi = Ti/rii. (7.84)
Характеристики тгг в ряде конкретных задач являются искомыми величинами, так как определяют, например, средние сроки эксплуатации между ремонтами, обслуживаниями, неисправностями и т. п. Величина %ц может быть определена через средние времена tt пребывания в t-м состоянии и стационарные вероятности состояний П = = (лг| вложенной в рассматриваемый ПМП марковской цепи:
(7.85)
(7.86)
С учетом (7.85) выражение (7.84) можно представить в виде
Рі=кіГіі7. (7.87)
Если все tt = ti одинаковы, то получим Ц = t, так как для любого марковского процесса, в том числе для ВМЦ, справедливо
S — 1.
i=l
При этом
Pi = Я,, (7.89)
т. е. если ПМП во всех состояниях пребывает в среднем одинаковое время, то стационарные вероятности пребывания в состояниях для ПМП и ВМЦ совпадают.
Для определения величин л; может быть использована система из п уравнений, которые записываются в соответствии с формулой полной вероятности в виде
^ = 2 К]Рл (і = 1. 2,…, п). (7.90)
ІЄЕ
Выражения (7.90) и (7.88) образуют систему п — J — 1 уравнений с п неизвестными. Для ее решения необходимо обязательно использовать нормирующее условие (7.88), а одно из уравнений (7.90), например наиболее сложное, исключить. Такая система при п < 5-р 8 легко решается вручную последовательной подстановкой неизвестных.
Важная характеристика ПМП — затраты на его выполнение. Введем показатель средних затрат на пребывание элемента в 1-м состоянии:
Ci = Cii7i + 2lPifiij, (7.91)
где Си — средние затраты за единицу времени пребывания в t-м состоянии; Сп — средние затраты на переход из і-го состояния в /-е.
Конструкция показателя С; (7.91) очевидна: первый член — это средние затраты за непосредственное пребывание в состоянии і; сумма — средние затраты на выход из него. В простейшем случае можно считать, что все затраты пропорциональны времени пребывания в t-м состоянии, т. е. Сц = 0 и
Ct = Cjt. (7.92)
Используя показатель (7.91), можно получить более общую для ПМП характеристику средних затрат за единицу времени процесса:
Числитель показателя (7.93) представляет собой средние затраты за один переход, а знаменатель — среднюю продолжительность одного перехода. Подставляя в (7.93) выражение (7.91), получим
(7.94)
«
При вычислении показателя С значения показателей Ciit Ciit
образующих квадратную матрицу С = {СгД, предполагаются известными.
Таким образом, если заданы граф состояний, матрица Q = = ШО) независимых функций распределения времени пребывания элемента в і-м состоянии перед переходом в /-е, если бы данный выход был единственным, а также матрица С ={С,/} затрат на пребывание в і-м состоянии и переход из него в у-е, то можно вычислить следующие характеристики ПМП:
1) вероятности Ра перехода из состояния і в состояние / в момент скачка — по (7.78);
2) средние продолжительности ti пребывания в і-м состоянии — по (7.82);
3) матрицу П — {лг} стационарных вероятностей состояний ВМЦ для данного ПМП решением системы из уравнения (7.88) и любых п — 1 уравнений (7.90);
4) среднюю продолжительность одного перехода — по (7.86);
5) средние интервалы времени Тц между последовательными попаданиями ПМП в одно и то же состояние — по (7.85);
6) стационарные вероятности Pt состояний ПМП — по (7.87);
7) средние затраты С за единицу времени ПМП — по (7.94).
Для расчета перечисленных характеристик необходимо решить систему из п сравнительно простых алгебраических уравнений при определении величин т. г. При достаточно сложных законах распределения Qij(t) могут встретиться трудности при вычислении интегралов (7.78) и (7.82), однако величины pi} и tt обычно имеют довольно простые выражения.
Заметим, что найденные по (7.87) вероятности Дг пребывания в различных состояниях позволяют легко вычислить такие показатели ЛК, как коэффициент технического использования, вероятность пребывания ЛК в состоянии скрытого отказа и другие составляющие обобщенного показателя надежности, т. е. находить функцию ограничений в задаче оптимизации параметров системы поддержания ЛК в готовности. При этом выражение (7.94) может быть использовано как целевая функция, а оптимизируемые параметры X = {xv } СПГ обычно являются параметрами распределений Qu(t), от них иногда зависит и матрица С:
Qu (t) = QtJ (іt, X); С (X) = {Си (X)}. (7.95)
С учетом полученных выше зависимостей приступим к постановке задачи оптимизации вектора X параметров системы поддержания ЛК в готовности к применению, заданной ПМП, для которого известны граф, включающий i=l,2, .., п состояний; матрица Q(X) = {Qu(t, X)}; матрица С(Х) = <Сгі(Х)}.
В такой задаче в качестве ограничений могут быть использованы какие-либо известные функции С(Р;) от вероятностей Pt пребывания СПГ в t-м состоянии. Например, если состояние і = 1 — работоспособное, то, по определению, вероятность того, что в случайный момент времени элемент (одноканальный ЛК) находится в работоспособном состоянии, является коэффициентом технического использования или
коэффициентом готовности (см. § 3.1, 3.2). При этом в качестве одного из возможных ограничений можно принять
К т. и(Х) = Р1(Х)>/Ст. и.тр,
где /(т. н.тГ — Требуемое значение величины Кт. п — Таким образом, в общем виде функция ограничений
G(X) = G[Pf(X)]; X = (xv };
где xv„, xVB — нижний и верхний пределы изменения оптимизируемого параметра Хч.
Сформулируем словесно постановку задачи оптимизации параметров СПГ ЛК, заданной ПМП [графом, матрицами Q(X) = {Qa(t,)} и С (X) = (С;7(Х)}1: найти такие значения вектора X = {xv } параметров СПГ ЛК на интервалах допустимых значений (xv„, xVB), при которых выполняются ограничения на функции G [Рг(Х)[ от вероятностей пребывания ЛК в различных состояниях, а затраты в единицу времени функционирования СПГ минимальны.
В соответствии со словесной постановкой задачи и зависимостями (7.94), (7.78), (7.82), (7.90), (7.89), (7.86), (7.87), (7.96) математическая постановка задачи принимает следующий вид:
7^7 S"i(X) [ад(Х)+ 2Pj'(X)C”(X)]=min;
PuW = 7 П [1 — QiK(t< X)] dQu(t, X);
0 кФІ
со
U (X) = Г П[1 — Qu(t, )]dt;
б’ ш
(X) = 2 r. j (X) рн (X); (і=1,2…………………. (п — 1));
Іфі
23 ^і(Х) = і;
*= 1
t (X) = jU(X)MX);
І— 1
Pi (X) = (Х)7 (X)/1 (X);
G [Рг (Х)| > GTp;
х = {* j; *v„ < xv < xvb •
При решении задачи (7.97)—(7.105) известны величины п* си (X), Сгі(Х), Qij{t, X), GTp, Хуи, хув.
Задача (7.97)—(7.105) распадается на последовательное определение величин Ри{Х), ti(X) по формулам (7.98) и (7.99); решение системы уравнений (7.100) и (7.101); вычисление функций /(X) и Рг(Х) по (7.102) и (7.103); решение задачи оптимизации при целевой функции (7.97) и ограничениях (7.104), (7.105).
В общем виде целевая функция и функция ограничений (7.104) нелинейны. Однако можно показать, что для обычно используемых видов распределений Qa{t, X), в том числе и описывающих переходы через неслучайное время [см. (7.84)], функции (7.97) и (7.104) — выпуклые. Таким образом, задача (7.97)—(7.105) относится к классу задач выпуклого программирования и обычно решается методами динамического программирования, так как в ней имеется четко выраженная этапность (последовательные переходы ПМП из состояния в состояние).
Однако при сравнительно малом числе состояний, когда последовательное определение математических ожиданий £{(Х), /(X), вероятностей ри{Х) и Рг(Х) по зависимостям (7.98)—(7.103) дает обозримые функции (7.97) и (7.104), могут быть использованы обычные методы выпуклого программирования (например, градиентный).
Особенно удачен такой подход, если можно в целевой функции считать все Ci} = 0, что соответствует обычно негрубому допущению о пропорциональности расходов на пребывание в і-м состоянии времени пребывания в нем, при котором платой за переход можно пренебречь. При этом задача оптимизации сводится к следующей постановке:
П
-і — У Сн (X) гг (Х)7г (X) = min; (7.107)
G[P;(X)]:»GTp; (7.108)
х={*,}: (7-109)
В задаче (7.107)—(7.109) предполагаются известными величины п, С и, GTP, xv„, xVB и функции7(Х), лг(Х),7г(Х), Рг(Х).
Возможности решения задачи оптимизации параметров X системы поддержания ЛК в готовности к применению продемонстрируем в § 7.6, а учет изменения вектора X в процессе эксплуатации — в § 7.7.